Algoritmo de Decodificación de Traducción Automática Estocástica basado en N-gramas
نویسندگان
چکیده
In this paper we describe MARIE, an N -gram-based stochastic machine translation decoder. It is implemented using a beam search strategy, with distortion (or reordering) capabilities. The underlying translation model is based on an N gram approach, extended to introduce reordering at the phrase level. The search graph structure is designed to perform very accurate comparisons, what allows for a high level of pruning, improving the decoder efficiency.
منابع مشابه
Integración de reordenamientos en el algoritmo de decodificación en traducción automática estocástica
This paper presents a reordering framework for statistical machine translation (SMT) where source-side reorderings are integrated into SMT decoding, allowing for a highly constrained reordered search graph. The monotone search is extended by means of a set of reordering patterns (linguistically motivated rewrite patterns). Patterns are automatically learnt in training from word-to-word alignmen...
متن کاملEstudio Bidireccional de un Sistema de RI Multilingüe Basado en Traducción de n-Gramas
Resumen Continuando nuestra investigación sobre el empleo de ngramas de caracteres como unidad de traducción en sistemas de RI Multilingüe, este art́ıculo analiza el comportamiento de nuestra solución en direcciones inversas de traducción a partir de sendos experimentos paralelos con consultas en inglés sobre textos en español y viceversa. Lo positivo de los resultados corrobora la validez de nu...
متن کاملClasificación de servicios Web mediante una red neuronal artificial usando n-gramas de palabras
Resumen. Este artículo presenta un enfoque basado en n-gramas de palabras para la clasificación automática de servicios Web utilizando una red neuronal artificial de tipo perceptrón multicapa. Los servicios Web contienen información de gran utilidad para lograr una clasificación basada en la funcionalidad del mismo. El enfoque se basa en n-gramas de palabras extraídas de la descripción del serv...
متن کاملGeneración automática de contenido para un nuevo juego basado en el problema de los tres cuerpos
Resumen Este trabajo presenta un algoritmo de generación de contenido por procedimientos capaz de crear mapas completos para un videojuego que simula fenómenos f́ısicos. El algoritmo evolutivo desarrollado intenta mejorar la dificultad de los mapas. Además, gracias al uso de poblaciones estructuradas, el algoritmo puede construir mapas que supongan un desaf́ıo tanto a los jugadores más avanzados ...
متن کاملModelo estocástico de traducción basado en N-gramas de tuplas bilinges y combinación log-lineal de características
This communication introduces a stochastic machine translation system based on Ngram modelling of the joint probability of bilingual texts. The basic unit of this model is called a tuple and consists of a pair of both source (to be translated) language and target language (translation) word-strings. Translation is driven by a log-linear combination of the N-gram model probability and other feat...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Procesamiento del Lenguaje Natural
دوره 35 شماره
صفحات -
تاریخ انتشار 2005